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摘 要 : 为 了 提高 云 计算 数据 调度 和 副本 访问 的 效率 ， 对 副本 策略 中 的 副本 放置 问题 进行 研究 ， 0 
算法 的 副本 放置 策略 。 根 据 自 然 界 中 蚁 群 砚 食 的 原理 ， 把 蚁 群 算法 应 用 于 副本 放置 的 整个 过 程 ; 利用 信息 素 的 动态 
更 新 以 及 拉 普 拉 斯 概率 分 布 改进 的 蚁 群 算法 , 得 出 一 组 最 优 解 进行 副本 放置 。 在 CloudSim 平台 上 进行 了 仿真 模拟 ， 
实验 结果 表明 ， 提 出 的 方案 在 平均 作业 完成 时 间 、 网 络 利 用 率 和 负载 均衡 度 上 优 于 原始 蚁 群 算法 ， 并 在 一 定 程度 上 
降低 了 副本 放置 时 间 消 耗 和 网 络 负载 。 
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Research on replica optimal placement strategy in cloud environment 
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Abstract: In order to improve the efficiency of data scheduling and replica access in cloud computing, the paper studied the 
replica placement problem in replica strategy and proposed a replica placement strategy based on ant colony algorithm. 
According to the principle of ant colony foraging in nature, ant colony algorithm applies to the entire process of replica 
placement. The pheromone dynamic updating and Laplace probability distribution improves the ant colony algorithm, a set 
of optimal solutions is obtained for replica placement. Simulation is on the CloudSim platform. The experimental results 
show that the proposed scheme is superior to the original ant colony algorithm in average job completion time, network 
utilization and load balance, and reduces the copy placement time consumption and network load to a certain extent. 
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0 ”引言 户 的 需求 。 文 献 [2] 针 对 云 计算 中 的 副本 问题 ， 从 副本 选择 方 
革 面 对 副 本 进行 了 优化 ， 并 与 蚁 群 算法 相 结合 。 对 虚拟 机 的 利 

随 着 互联 网 的 发 展 ， 复 杂 而 庞大 的 数据 需要 被 处 理 。 据 用 状况 进行 了 探究 ， 最 终 达 到 优化 了 负载 均衡 。 文 献 [3] 考 虑 
互联 网 数据 中 心 的 研究 报告 显示 ， 未 来 数据 的 增长 是 几何 式 到 数据 开销 和 存储 开销 ， 提 出 兼顾 成 本 和 存储 空间 的 副本 策 
的 ， 特 别 是 移动 终端 。 因 此 ， 海 量 数 据 的 及 时 有 效 处 理 就 成 名。 利用 遗传 算法 和 Dijkstra 算法 进行 优化 ， 取 得 了 很 好 的 
为 了 或 待 解决 的 问题 。 云 计算 技术 的 兴起 ， 尤 其 是 云 存储 技 效果。 文献 [外 为 使 副本 能 在 存储 节点 上 被 合理 分 配 ， 通 过 建 
术 的 出 现 ， 使 多 种 类 型 的 存储 设备 连接 起 来 进行 信息 交互 ， 立 关 系 模型 维持 最 小 副本 数量 ， 提 高 数据 副本 可 用 性 。 文 献 
并 实现 了 协同 合作 。 云 计算 环境 由 于 数据 量 大 和 存储 设备 和 [5] 考虑 到 云 存 储 系统 中 副本 访问 开销 大 的 问题 。 提 出 把 萤 火 
网 络 设备 差异 的 原因 ， 会 导致 数据 的 丢失 和 出 错 ， 而 副本 技 “，” 虫 算 法 应 用 于 副本 放置 过 程 中 ， 利 用 萤火虫 的 自然 属性 ， 建 
术 的 出 现 ， 能 够 有 效 的 解决 这 种 问题 。 通 常 在 存储 系统 中 采 ” 立 相 关 的 模型 。 仿 真实 验 表 明 该 算法 对 副本 放置 有 着 较 好 的 
用 多 个 副本 ， 这 样 可 以 保证 存储 系统 中 数据 的 高 可 用 性 和 高 。 效果 。 文献 [6] 提 出 异 构 环 境 下 云 计算 副本 动态 管理 模型 ， 可 
容错 率 。 以 有 效 减 少 节点 之 间 的 数据 传输 。 文 献 [7] 提 出 动态 副本 分 布 
于 系统 性 能 和 节点 负载 密切 相关 ， 云 存储 记录 会 表现 。 方法 ， 有 效 平衡 了 副本 开销 和 访问 性 能 之 间 的 关系 ， 优 化 了 
新 近 数 据 的 局 部 性 特点 。 如 果 系统 负载 不 均衡 ， 单 个 节点 的 副本 分 布 。 文献 [8] 为 改进 Qos 和 操作 开销 ,提出 一 种 有 效 的 
数据 存储 负载 量 会 增 大 ,用 户 对 节点 的 访问 性 能 将 大 大 降低 。 ” 贪 禁 启发 式 算法 来 解决 副本 放置 问题 ， 通 过 布局 和 细 化 ， 优 
同样 ,热点 数据 分 布 不 均衡 也 会 影响 用 户 的 读 写 性 能 ,因此 ， 化 了 计算 的 时 间 ， 取 得 了 不 错 的 效果 。 文 献 [9] 综 合 考 虑 统计 
如 何在 云 存储 系统 中 合理 放置 副本 是 一 个 值得 研究 的 问题 。 周期 、 文 件 大 小 、 工 作 环境 等 多 种 因素 ， 提 出 基于 热度 分 析 
为 了 更 加 有 效 地 改善 云 计算 的 副本 技术 性 能 ， 学 者 针对 ”的 副本 创建 方法 ， 根 据 文件 的 访问 热度 ， 动 态 调整 副本 ， 提 
云 计算 中 的 副本 策略 所 遇 到 的 问题 展开 了 研究 。 文献 [1] 针 对 ”高 了 服务 性 能 。 文 献 [10] 提 出 一 种 在 云 中 动态 数据 复制 方法 ， 
云 存储 系统 中 节点 的 异 构 性 ， 结 合 改进 的 粒子 群 算法 对 副本 ”通过 使 用 目录 索引 副本 位 置信 息 ， 最 终 将 副本 存储 在 有 足够 
选择 策略 进行 改进 ， 使 副本 选择 的 效率 得 以 提升 ， 满 足 了 用 ”空间 的 系统 中 , 以 此 来 增加 资源 可 用 性 和 达到 最 小 访问 成 本 。 
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上 述 文献 虽然 对 副本 技术 进行 了 相关 的 研究 ， 但 对 云 计 
算 中 的 数据 调度 和 访问 效率 方面 的 研究 仍 有 所 欠缺 ， 且 在 副 
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c) 蚁 群 信息 素 的 正 反馈 作用 , 使 蚁 群 的 行走 路 径 逐 渐变 
得 统一 ， 最 终 到 达 目 的 地 ， 完 成 对 目标 的 放置 。 此 条 路 径 便 


是 目标 放置 的 最 优 解 。 


本 管理 技术 中 ， 作 为 关键 问题 的 副本 放置 研究 相对 较 少 ， 还 
需 进一步 研究 。 本 文 在 研究 副本 放置 的 特性 、 现 有 蚁 群 算法 
基础 上 ， 提 出 了 基于 改进 蚁 群 算法 的 副本 放置 研究 策略 。 该 


算法 利用 蚁 群 信 息 素 动态 更 新 和 拉 普 拉 斯 概率 分 布 改进 的 蚁 
群 概率 选择 ， 最 终 形成 本 文中 的 改进 蚁 群 算法 。 充 分 利用 蚁 
群 算法 的 分 布 性 、 随 机 性 、 反 馈 性 特点 ， 并 结合 副本 放置 ， 
形成 本 文 的 解决 方案 。 通 过 云 计 算 仿 真 器 CloudSim 进行 模 
拟 ， 该 算法 在 系统 平均 作业 完成 时 间 、 网 络 利 用 率 和 负载 均 
衡 等 方面 有 较 好 的 表现 。 
1 ”副本 放置 问题 描述 

本 文 的 研究 在 于 副本 放置 问题 ， 而 副本 管理 中 的 其 他 问 
题 并 不 完全 在 此 圳 括 。 在 云 存 储 系统 中 , 在 副本 被 创建 之 后 ， 
用 户 需 要 对 副本 进行 合理 的 放置 以 保证 数据 的 访问 的 性 能 。 
系统 会 在 一 系列 副本 中 选 出 最 佳 的 副本 进行 放置 。 不 同系 统 
的 副本 放置 的 标准 也 会 不 同 。 当 有 符合 系统 要 求 多 个 副本 需 
要 放置 时 ， 通 过 统计 不 同文 件 的 访问 开销 ， 首 先 对 文件 访问 
频率 贡献 大 的 副本 进行 放置 。 定 义 文件 的 访问 频率 为 

file,(f) -em xC) r= {2.8) (1) 

圾 办: R 表示 整个 系统 中 的 副本 的 个 数 ，file.(7) 表示 高 频率 
文件 在 副本 > 中 频率 的 大 小 ， 用 C! 来 表示 文件 在 第 t 个 时 间 
周期 内 被 请 求 访问 的 次 数 。 

文件 所 应 放置 的 副本 的 数量 Ni 为 


Nx fle.(f) 


N/ = = 
2 file,(7) 


,r={1,2,..R} O) 


最 后 响应 给 请 求 的 
过 程 : 

a) 根据 用 户 请 求 中 给 定 的 检索 文件 名 , 通过 云 存储 系统 
的 副本 管理 器 查找 该 检索 文件 名 对 应 的 若干 个 副本 位 置信 息 


j 户 。 副 本 放置 中 有 以 下 两 个 关键 的 


b) 在 问题 a) 的 基础 上 ， 查 找 出 的 若干 个 副本 信息 集合 
后 ， 利 用 相关 副本 放置 策略 再 进行 相关 副本 的 放置 。 


it 


根据 上 面 的 思路 ， 把 蚁 群 抽象 成 选择 放置 副本 的 检索 文 
件 RF(retrieve files), 同时 会 为 该 文件 创建 和 寻找 相应 的 副本 。 
把 蚂蚁 行走 路 径 的 集合 抽象 为 副本 对 象 的 集合 R=fa,p…z}， 
这 样 蚂蚁 疯 食 的 过 程 就 变 成 了 检索 文件 寻找 相应 副本 并 放置 
的 过 程 。 假 设 蚂蚁 寻 食 行走 的 路 径 集 合 为 P={psps…p"} ,这 里 
n 为 蚂蚁 的 个 数 ， 砚 食 过 程 中 所 产生 的 信息 素 表示 为 集合 
14 

设置 整个 蚁 群 是 一 个 可 行 解 的 解 空间 ， 整 个 蚁 群 表 示 为 
A， 整 个 流程 开始 之 前 ， 本 文 需要 对 副本 的 信息 素 值 进行 初 
始 化 : 


(0)= readspeed 


G3) 


replicasize 


其 中 :replicasize 指 的 是 副本 大 小 ，readspeed 指 的 是 读 取 的 
速度 。 从 公式 中 可 以 看 出 读 取 速度 越 大 ， 副 本 越 小 ， 信 息 素 
的 初 值 就 会 越 大 。 

当 副 本 被 访问 多 次 之 后 ， 信 息 素 会 相应 的 发 生变 化 ， 信 
息 素 相应 的 属性 值 也 需要 调整 ， 表 达 式 为 


ZL+D=DT(OOD+AT(OD (4) 

信息 素 挥发 系数 2 的 设 定 是 否 合理 会 影响 蚁 群 的 搜索 能 
力 和 计算 效率 。 在 结合 传统 信息 素 更 新 方法 上 ， 引 入 动态 改 
变 2 值 的 方法 ， 使 2 能 自 适应 的 改变 大 小 ， 从 而 保证 算法 的 
综合 性 能 。 现 给 出 本 文 的 调整 策略 。 


Pp,(D)=1-In(D) /In(t +o) (5) 
Duin Du(D < Dain 

PpP(D)=1p, Puin(?) < pil!) SA Da (6) 
Pi Pa ll) > Prax 


其 中 : c 为 常数 ，2 的 取 值 是 信息 素 动态 更 新 的 关键 ，2 太 
大 会 使 全 局 搜索 能 力 下 降 ， 2 太 小 会 使 局 部 搜索 能 力 变 差 ， 

改 敛 的 速度 也 会 变 慢 。 为 了 使 挥发 性 系数 2 在 一 定 范围 内 具 
有 自 适 应 性 ， 挥 发 系数 2 控制 在 [em,pus] ， 并 对 其 取 值 为 
[0.2,0.8]， 这 样 可 以 拉 开 副本 间 信 息 素 的 差距 , 并 在 后 期 加 快 
收敛 的 速度 。 
蚁 群 在 路 径 上 留 下 的 信息 素 的 浓度 和 副本 能 否 被 放置 有 


为 了 提高 存储 资源 的 利用 率 和 数据 文件 的 可 靠 性 ， 应 该 
综合 考虑 网 络 的 访问 性 能 、 负 载 均衡 、 响 应 延迟 和 存储 开销 
等 方面 。 满 足 用 户 的 动态 需求 。 如 放置 副本 时 ， 需 考虑 是 放 
置 在 本 地 还 是 远程 放置 。 因 此 ， 可 以 说 副本 放置 问题 是 综合 
多 种 因素 进行 求解 优化 的 过 程 。 

2 ”基于 蚁 群 优化 的 副本 放置 算法 

蚁 群 算法 是 通过 模拟 自然 界 中 蚂蚁 郧 食 行 走 的 路 径 而 产 
生 的 算法 。 曙 蚁 在 疯 食 过 程 中 ， 会 留 下 信息 素 进行 群体 的 交 
流 ， 信 息 素 的 多 少 决定 了 曲 蚁 在 此 路 径 曙 蚁 的 多 少 。 曙 蚁 通 
过 这 种 正 反 馈 的 形式 使 蚁 群 逐渐 收 僵 ， 最 终 曲 蚁 会 在 蚁 帘 和 
食物 源 中 找到 一 条 最 短 的 路 径 。 
2.1 蚁 群 优化 算法 核心 描述 

本 节 介绍 蚁 群 算法 在 解决 副本 放置 问题 的 基本 思路 ， 
本 如 下 所 示 : 

a) 把 蚂蚁 疯 食 时 行走 的 路 径 抽象 成 目 
过 程 ， 把 路 径 集合 抽象 成 一 个 解 空间 。 

b) 蚂蚁 移动 过 程 中 , 会 留 下 信息 素 。 信息 素 会 随 着 时 间 
在 较 短路 径 上 越 来 越 浓 ， 选 择 这 条 路 的 蚂蚁 也 会 越 来 越 多 。 


标 放 置 前 选择 的 


着 密切 的 联系 ， 在 信息 素 浓 度 越 高 的 地 方 ， 副 本 被 放置 的 概 

率 就 会 越 大 。 副 本 放置 的 概率 公式 定义 如 下 : 

| OVAG jue 副 本 

已 ()=12> [ri(D]*[7j(D]4 (7) 
0 其 他 


其 中 :50 指 的 是 副本 j 在 1 时 刻 的 信息 素 的 浓度 ， 力 表示 昌 
本 本 身 的 固有 属性 。% 和 分别 分 别 指 代 副 本 当前 的 信息 素 
启发 因子 和 期 望 启发 因子 。 如 果 & 比 8 的 值 大 ， 说 明 在 节点 
选择 中 ， 信 息 素 浓度 的 作用 比 副本 固有 属性 的 影响 大 。 为 避 
免 蚁 群 算法 过 早 陷 入 局 部 最 优 ， 使 算法 综合 求解 性 能 较 好 ， 
经 过 实验 验证 ， 本 文 取 4 为 3，B 为 1.5。 

在 传统 的 蚁 群 算法 中 ， 副 本 放置 的 概率 选择 都 是 采用 随 
机 概率 rand 结合 式 (7) 进 行 概率 匹配 。 随 机 性 概率 选择 策略 
可 以 避免 出 现 停滞 现象 ， 但 是 收敛 的 速度 慢 。 为 使 算法 能 较 
快 的 收敛 于 最 优 解 ， 在 实验 的 基础 上 ， 本 文 引入 了 拉 普 拉 斯 
概率 分 布 的 思想 ， 采 用 最 大 概率 选择 的 方法 ， 在 原 有 蚁 群 算 
法 的 基础 上 进行 了 改进 。 在 副本 放置 的 过 程 中 ， 先 计算 出 转 
移 概率 最 大 的 对 象 MaxP， 再 进行 循环 遍历 ， 计 算出 副本 放 
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置 对 象 的 概率 和 最 大 概率 MaxP 之 间 的 距离 ， 选 取 最 靠近 Cs 
a El 从 - 3 ”实验 设计 与 结果 分 析 
MaxP 的 副本 进行 放置 ， 可 得 公式 : 
PQ) =[MaxP —rand, MaxP + rand],i={1,2,..m)} (8) 本 实验 采用 CloudSim 云 计 算 仿 真 器 进行 实验 的 仿真 。 


则 第 i 个 副本 对 象 将 会 被 选择 放置 。 CloudSim 支持 云 计算 环境 的 资源 模拟 , 可 以 对 副本 管理 中 相 
式 (7) 可 得 副本 信息 素 的 浓度 越 高 ， 则 副本 在 被 选择 放 ”” 关 环 境 进行 仿真 模拟 。 利 用 CloudSim 的 扩展 性 ， 修 改 Host 
置 的 时 候 ， 被 选中 的 概率 就 会 越 大 ， 但 是 在 考虑 放置 副本 的 和 DataCenter 类 ,添加 新 的 副本 放置 组 件 完 成 副本 放置 工作 ， 
时 候 ， 节 点 的 负载 和 网 络 的 畅通 也 是 考虑 的 重要 的 因素 。 本 ”比较 副本 访问 时 间 的 开销 、 网 络 利 用 率 和 负载 均衡 度 。 本 实 
文 引 入 类 拉 普 拉 斯 概率 分 布 选择 最 大 概率 副本 进行 放置 的 方 ” 验 对 改进 蚁 群 算法 、 原 始 蚁 群 算法 和 Min-Min 算法 进行 仿真 。 
法 ， 可 以 有 效 防止 网 络 的 拥塞 并 在 一 定 的 程度 上 节省 了 存储 “实验 环境 为 : 软件 采用 window10 操作 系统 CloudSim3.0.3， 


的 空间 。 硬件 采用 i5-7300HQ@2.5GHz， 内 存 为 8GB。 
2.2 蚁 群 优化 副本 放置 流程 CloudSim 仿真 实验 步骤 : 
云 存 储 系 统 在 受到 副本 文件 RF 的 请 求 后 ， 利 用 本 文 所 a) 初 始 化 CloudSim 包 。 
提出 的 副本 放置 的 方法 对 信息 素 的 副本 依次 进行 放置 。 下 再 b) 创 建 数据 中 心 。 
是 利用 蚁 群 算法 对 副本 文件 进行 放置 的 流程 : c) 创 建 数据 代理 中 心 。 
a) 初 始 化 副本 信息 素 。 dd) 创建 云 任 务 。 
b) 根 据 式 (1) 计 算 副 本 文件 RF 的 访问 频率 和 存储 的 节点 e) 读 取 副 本 ， 并 进行 副本 对 象 的 放置 。 
情况 。 人 启动 仿真 。 
c) 若 副本 文件 存储 在 远程 节点 ， 则 依据 改进 蚁 群 算法 进 如 仿真 结束 后 分 析 结 果 。 
行 副 本 的 放置 。 本 实验 中 算法 设计 的 参数 如 表 1 所 示 。 
qd) 对 副本 对 象 进 行 概率 匹配 ， 据 选择 的 概率 根据 式 (7)(8) 表 1 蚁 群 算法 基本 数据 
选 出 合适 的 副本 。 Table 1 Basic Data of Ant Colony Algorithms 
e) 选 择 出 副本 之 后 ， 数 据 传 往 终端 ， 终 端 在 获取 副本 之 名 称 值 
前 ， 使 用 式 (5) 减 小 副本 信息 值 ， 降 低 被 重复 访问 的 概率 ， 平 作业 数 100~800 
衡 节 点 负载 。 启发 因子 w 3 
全 若 副 本 在 本 地 进行 存储 ， 则 直接 读 取 本 地 副本 ， 不 必 期 望 启发 因子 6 1.5 
执行 蚁 群 副本 放置 。 信息 素 挥发 因子 P 0.2~0.8 
g) 若 副本 的 相关 数据 没有 被 读 取 成 功 ， 则 跳 转 Step2 进 蚂蚁 数量 m 50 
行 下 一 个 副本 对 象 的 读 取 。 最 大 人 迭代 次 数 7 200 
h) 当 副本 被 读 取 成 功 的 时 候 ， 判 断 是 不 是 最 后 一 个 副本 本 次 实验 分 为 三 组 ， 分 别 从 平均 作业 完成 时 间 、 网 络 利 
对 象 ， 如 果 是 ， 则 结束 副本 放置 ， 如 果 不 是 ， 再 次 读 取 下 一 用 率 、 负 载 均 衡 度 三 个 方面 对 改进 蚁 群 算法 、 原 始 蚁 群 算法 、 
个 副本 对 象 ， 进 行 改进 蚁 群 副 本 放置 。 Min-Min 算法 进行 性 能 评估 ， 并 对 实验 结果 进行 比较 。 最 终 
其 算法 流程 图 如 图 1 所 示 。 形成 本 次 仿真 实验 。 
三 二 1) 平均 作业 完成 时 间 
N= 为 了 验证 改进 蚁 群 算法 在 作业 完成 时 间 的 优势 ， 本 文选 
v 择 与 原始 蚁 群 算法 和 Min-Min 算法 进行 对 比 ， 为 了 准确 地 对 
— tt 比 三 种 不 同 的 算法 ， 引 入 平均 作业 完成 时 间 。 
T= (9) 
| 其 中 : 工 为 第 i 个 作业 的 运行 时 间 ，n 为 运行 作业 的 总 数 。 
平均 作业 时 间 是 指 执 行 所 有 作业 的 整个 时 间 与 作业 完成 总 数 


继 的 比值 。 
续 远程 读 取 副 本 读 取 本 地 副本 Popp Eee 
这 目 改 进 蚊 群 算法 “ 目 原始 蚁 群 算法 
历 
人 
| vy 800 
个 
对 概率 匹配 700 
象 
一 600 
< 
一 500 
部 ,0 
+ 300 
200 
100 
0 100 200 300 400 500 
平均 作业 完成 时 间 
图 1 算法 流程 图 图 2 平均 作业 完成 时 间 


Fig.1 Algorithm flow chart Fig.2 Average homework completion time 
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目 改进 蚁 群 算法 目 Min-Min 算 法 
800 
700 
_ 600 
Sso0 
疾 400 
六 a0 
200 
100 , | | 
0 100 200 300 400 500 600 
平均 作业 完成 时 间 
图 3 平均 作业 完成 时 间 
Fig.3 Average homework completion time 
通过 图 2 和 3 实验 数据 分 析 可 得 ,在 作业 完成 时 间 上 , 改 


进 的 


蚁 群 算法 比 原始 蚁 群 算法 和 Min-Min 算法 都 要 短 。 因 为 


Min-Min 算法 总 是 将 作业 分 配 到 处 理 
一 部 分 资源 处 于 一 直 处 于 工作 状态 ， 
能 够 最 短 时 间 


空闲 状态 ， 以 保证 作业 


时 间 最 短 的 资源 上 ， 使 
而 另外 一 部 分 一 直 处 于 
完成 ， 这 样 就 造成 作业 


分 配 不 合理 。 而 蚁 群 算法 的 全 局 搜索 能 力 使 其 在 作业 完成 时 


具有 优势 。 改 进 之 后 的 蚁 群 算法 ， 在 进行 信息 素 和 概 
择 的 优化 后 ， 与 原始 蚁 群 算法 相 比 ， 作 业 完 成 的 效率 上 
图 中 可 以 看 出 改进 的 蚁 群 算法 对 于 原始 蚁 
群 算法 平均 作业 完成 时 间 减 少 了 14%~25%。 与 Min-Min 算 


时 需要 更 新 副本 ， 并 由 此 而 需要 消耗 


网 络 带宽 ， 定 义 网 络 利用 率 来 表示 不 同 算法 对 网 


间 上 更 

率 选 

有 明显 的 改善 。 从 

法 相 比 ， 平 均 作 业 完 成 时 间 减 少 了 27%~40%。 
2) 网 络 的 利用 率 
为 了 描述 副本 放 

时 间 和 占 

络 的 利用 程度 。 


Renu= 


且 . 


Nw 是 指 作业 运行 放置 时 
本 地 节点 中 访问 副本 的 次 数 。 
用 率 小 ， 同 时 该 算法 占 
载 就 小 ， 相 应 


be 


Nonoe ie 十 人 file—replicas 


(10) 


N, local— file 


中 :Ne 是 指 计算 单元 从 远程 节点 访问 副本 的 次 数 ， 


相关 的 副本 数 ， wow-m 是 指 从 
Ravw 越 小 ， 表 示 算 法 的 网 络 利 


的 网 络 资源 就 小 ， 给 网 络 带 来 的 负 
也 会 说 明 该 算法 表现 更 优秀 。 


量 改 进 蚁 群 算法 Min-Min 算 法 
800 
700 
600 
Sso0 
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100 
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网 络 利 用 率 (%) 
图 4 网 络 利用 率 
Fig.4 Network utilization ratio 
从 图 4 中 可 以 看 出 改进 之 后 的 蚁 群 算法 相 比 于 Min-Min 


算法 差别 很 大 ， 根 据 前 面 给 出 的 定义 和 式 〈10) ， 改 进 之 后 


的 蚁 群 算法 在 网 络 负载 方 
法 ， 提 升 约 8.5 个 百分点 。 


表现 更 加 优异 ， 相 比 Min-Min 算 
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国 改 进 蚊 群 算法 里 原始 蚁 群 算法 
800 
700 
600 
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冰 400 
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0.56 0.58 0.6 0.62 0.64 0.66 0.68 0.7 
网 络 利用 率 〈%) 
图 5 网 络 利 用 率 
Fig.5 Network utilization ratio 

从 图 5 中 可 以 看 到 ， 虽 然 改进 之 后 蚁 群 算法 在 不 同 作 业 

数 下 网 络 利用 率 数 值 波动 较 大 。 但 从 整体 上 看 ， 对 比 原始 蚁 

之 后 的 蚁 群 算法 在 网 络 利 用 率 上 表现 更 好 ， 提 


群 算 法 ， 改 进 
升 了 约 0.2 个 百分点 。 
3) 负载 均衡 度 
在 实验 的 过 程 中 


FPF， 在 不 同 的 作业 数 的 情况 下 ， 对 负载 均 


衡 程度 进行 了 统计 。 计 算 分 析 可 以 得 出 不 同 算法 在 作业 数 增 
加 时 ， 负 载 均衡 的 情况 。 负 载 均衡 度 ZB 的 公式 为 


从 图 6 中 本 


到 
LB= ,|— >》 (c,-—c)™ 
P20 ) 


以 看 出 ， 改 进 蚁 群 算法 相对 于 Min-Min 算法 


4D) 


相 比 ， 由 于 系统 资源 节点 作出 实时 的 调整 ， 故 改进 蚁 群 算法 
有 较 大 的 优势 。 相 对 于 原始 蚁 群 算法 ， 改 进 之 后 的 蚁 群 算法 
表现 得 略 好 。 
一 一 改进 蚊 群 算法 不 始 蚁 群 算法 。 一 上 一 Min-Min 算 法 

120 5 

100 上 
80 上 
S60 上 
40 

20 5 

" 100 200 300 400 500 600 700 800 

作业 数 (个) 
图 6 负载 均衡 度 
Fig.6 Load balancing degree 
4 ”结束 语 
针对 云 环境 下 多 副本 管理 中 的 副本 放置 问题 ， 本 文 提出 

了 一 种 基于 改进 蚁 群 优化 的 副本 放置 算法 。 通 过 蚁 群 算法 的 
言 息 动态 更 新 方式 和 改进 概率 选择 方式 使 蚁 群 能 够 更 好 的 进 
行路 径 的 选择 ， 最 终 把 副本 放置 在 最 佳 的 位 置 。 全 面 考 虑 副 
本 放置 性 能 对 调度 效率 和 访问 性 能 的 影响 ， 并 在 云 计算 模拟 


器 CloudSim 中 进行 了 模拟 实验 。 用 三 组 实验 对 本 文 改 进 的 


算法 进行 验证 ， 实 验 结果 表明 与 原始 蚁 群 算法 、Min-Min 算 
法 相 比 ， 改 进 之 后 的 蚁 群 算法 在 平均 作业 完成 时 间 上 有 着 优 
秀 的 表现 ， 能 够 有 效 地 减少 副本 放置 过 程 时 间 的 消耗 ， 同 时 
能 更 好 的 平衡 网 络 的 负载 。 在 接 下 来 的 工作 中 ， 研 究 副 本 创 
建 和 副本 定位 等 副本 策略 其 他 领域 将 是 下 一 步 的 工作 重心 。 
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